home *** CD-ROM | disk | FTP | other *** search
/ MacFormat 1996 March / macformat-035.iso / Shareware City / Science / DNA stacks 1.1 / DNA Stacks Info < prev    next >
Encoding:
Text File  |  1995-12-31  |  19.3 KB  |  354 lines  |  [TEXT/ttxt]

  1. DNA Stacks Info
  2.  
  3. Features of DNA Stacks HyperCard 2.0 stacks
  4. Version 1.1 (12/95) Copyright 1990-1995 D. J. Eernisse
  5. Email: DEernisse@fullerton.edu
  6. WWW: http://biology.fullerton.edu/people/faculty/doug-eernisse
  7. Mailing address: Dept. Biol. Sci. MH282, Calif. St. Univ.,
  8.    Fullerton, CA 92634
  9.  
  10. For a description of version 1.0 see:
  11.  
  12. Eernisse, D. J. 1992. DNA Translator and Aligner: HyperCard utilities
  13.     to aid phylogenetic analysis of molecules. CABIOS 8: 177-184.
  14.                    
  15. DNA Stacks is a software package of HyperCard 2.x stacks providing 
  16. complementary sets of utilities for viewing and manipulating molecular 
  17. data on a Macintosh computer. 
  18.  
  19. The best way to get the most current version of DNA Stacks is from the 
  20. author's home page: 
  21. <http://biology.fullerton.edu/people/faculty/doug-eernisse>.
  22.  
  23. The stack package has three main stacks: DNA Translator, Aligner,
  24. and Codon Usage. The package also includes a stack called Startup, which
  25. is used internally by the other stacks, and File Combiner, which is a
  26. more general utility stack useful for combining folders of sequence files
  27. together.
  28.  
  29. DNA Translator stack has two kinds of "cards." A gene mapping facility draws
  30. and displays 2 linearized gene maps for comparison, automatically
  31. adjustable to desired scales and locations along all or part of the mapped
  32. molecule. Maps and select corresponding complete sequence data are provided
  33. for most available fully documented mitochondrial and chloroplast DNA
  34. (mtDNA and cpDNA) sequences, which include 26 animal, 1 yeast, and 1 ciliate
  35. mtDNAs and 3 green plant cpDNAs. Additional gene maps may be user-created
  36. by a direct file conversion of standard GenBank- or EMBL-format documented
  37. sequences and their features tables.  A user can extract the
  38. sequence of any particular mapped gene or region by clicking on
  39. the corresponding place on the gene map or by menu selection of the gene or 
  40. feature and mapped taxon.  DNA Translator utility cards are a
  41. workbench of specialized sequence manipulation tools, catering especially
  42. to those with interests in phylogenetic analysis. DNA Translator can also import 
  43. single or multiple sequences in a variety of formats, including multiple aligned
  44. sequence output of various programs (EuGene, Prophet, CLUSTAL, Nexus,
  45. PHYLIP, etc.), and then further manipulate, interleave, compare or
  46. translate the gene sequences to amino acids. Multiple aligned sequences can
  47. be converted to Nexus, Hennig86 or PHYLIP for subsequent phylogenetic
  48. analysis. Most known deviations from the "universal" code, which are
  49. typical for mtDNAs, may optionally be used during translation.
  50.  
  51. Note that extraction of animal mtDNA sequences and many of the 
  52. translation/report utilities are now available and easier to use from 
  53. the "Data" menu of Aligner stack, described next. 
  54.  
  55. Aligner is a stack for manual editing and display of multiple sequence alignments.
  56. Aligner 1) handles up to 100  sequences, each up to 30,000 bp or amino 
  57. acid residues in length; 2) displays sequences as "interleaves" with the number 
  58. of lines automatically adjusting for the number of sequences imported; 
  59. 3) imports or exports multiple sequences by default in "named" string format 
  60. (i.e., 'Name<space(s)>AGCTGA...<rtn>'), which is the same as PAUP's "simple text" 
  61. format; 4) additionally will import/export numerous other formats that are widely 
  62. used, including support for interleaved sequences; 5) additionally will export a 
  63. wide variety of alignment/sequence reports or filtered sequence data; 
  64. 6) can toggle between two window widths, either full 640 or 512 pixels 
  65. ("standard" or "classic" monitor display widths) and can be expanded up to a
  66. 1200 pixel window length; 7) can quickly toggle between match characters 
  67. (dashes) to the first sequence and no match characters; 8) can more slowly 
  68. color-code base pairs, amino acids, or codons, including support of alternative 
  69. genetic codes; 9) supports addition/deletion of one or more gaps to all but the 
  70. current sequence; 10) speaks nucleotide/peptide characters during keyboard 
  71. entry or after entry starting from the current insertion point; 11) extracts 
  72. a selection of about 15 DNA or corresponding amino acid sequences to 
  73. Aligner, where the gene is any animal mtDNA gene and the sequences are a selection 
  74. of either metazoans or mostly vertebrate metazoan sequences; 12) allows one to align 
  75. amino acids, then introduce gaps to the corresponding unaligned nucleotide strings 
  76. to preserve the amino acid alignment; 13) has an error checking facility to check 
  77. current alignment against the starting strings, disregarding any added gaps; 
  78. 14) has optional help facilities, including this general overview, a tutorial to 
  79. using Aligner, and a baloon-like help feature that optionally displays the function 
  80. of fields or buttons as the cursor enters them.
  81.  
  82. Codon Usage stack displays codon and amino acid usage data as it differs for a 
  83. wide variety of organisms and organelles. Dynamically-constructed graphs display 
  84. percentage usage for a particular codon relative to the other 63 codons or to only 
  85. other codons with equivalent amino acid coding. A user can select from a diverse 
  86. list of some 70 taxon-organelle combinations. 
  87.  
  88. The codon usage, translation and gene mapping data can be exported or
  89. imported in spreadsheet format for incorporating additional molecules of
  90. interest or in various standard formats (UWGCG, GenBank,
  91. EMBL,Intelligenetics). A built-in editor supports sequence entry with
  92. optional computer-speaking for error checking, and a variety of output
  93. conversion options. 
  94.  
  95. Summary of enhancements to versions since 1.0
  96. (Numerous bug fixes are not detailed here)
  97.     Copyright 1990-1995 D. J. Eernisse
  98.     deernisse@fullerton.edu
  99.  
  100.  
  101. New features added since version 1.0 (Eernisse, 1992)
  102.  
  103. General:
  104.  
  105. DNA Translator stack:
  106. * gene mapping matrices can now be exported/imported from the menu of
  107.   gene mapping cards, whereas before these features were hidden.
  108. * Added a feature to report sequence composition statistics by codon
  109. * modified interleave" format conversion so that first and last taxon 
  110.   names are guessed at before making the user enter them manually
  111. * added support for Phylip input files and for the output created
  112.   by GCG's "Pilepup" and Jotun Hein's alignment algoriths.
  113. * multiple animal mtDNA gene sequences can now be exported to a single 
  114.   file or directly to Aligner, and amino acid sequences can be exported 
  115.   at the same time, in the case of coding DNA sequences
  116. * added capabilities to test how likely it is that "signal" in a sequence
  117.   alignment could be due to experimental error, rather than historical
  118.   (phylogenetic) signal
  119. * added a recoding option so that amino acid alignments can be treated
  120.   as if it were DNA or RNA data (assuming equal weighting is used).
  121. * it is now possible to create Nexus-format "Charsets" for use in PAUP
  122.   from a comment line in a user's alignment
  123. * it is now possible to extract only those sites in an alignment that 
  124.   were included in a charset to a second alignment file.
  125. * one can now output matrices of pairwise transition/transversion tallies 
  126.   or pairwise percent identity for any number of named strings and,
  127.   for the "Substitution" (transition/transversion) matrices, there is an 
  128.   option to specify whether the tallies should be reported by codon position
  129.   for for all positions.
  130. * added a feature for combining two alignments into a single alignment, 
  131.   provided at least one sequence is common to both alignments
  132. * streamlined the GenBank/EMBL conversion so that a minimum of prompts are
  133.   required from the user
  134. * improved certain hierarchical menus in DNA Translator
  135. * added facilities to create PAUP blocks to automate the calculation of
  136.   "Support Index" values for all nodes of all input trees in Nexus format
  137. * added the ability to calculate synonymous and nonsynonymous changes, using 
  138.   the method of Nei and Gojobori
  139. * added a special purpose data conversion to make it possible to treat 2nd 
  140.   positions normal (A,C,G, or T) while ignoring transitions at all 1st and 
  141.   3rd positions
  142. * added the ability to compute a log determinant distance matrix (see Mol. Biol. 
  143.   Evol. 7/94)
  144. * added support for newer versions of HyperCard or HyperCard Player, but did not
  145.   use any HyperTalk commands specific to the newer versions so the stacks should,
  146.   in theory, work on all versions back to version 2.0
  147.  
  148. Aligner stack:
  149. * added many options to color the alignments, including the ability to
  150.   color triplets of DNA that corresponds to amino acid coding, or coloring
  151.   according to chemical, functional, hydrophobic/hydrophilic, and ionic charge 
  152.   groups of amino acid sequences (or DNA triplets that code for amino acids.
  153. * added an online tutorial that will give users practice working with
  154.   some of the more advanced features of Aligner
  155. * sequences with different genetic codes can be colored in a single alignmtent
  156. * improved sequence selection, sequence entry, and key filtering for editing
  157.   data in Aligner
  158. * improved several of the navigation buttons and indicators
  159. * the card size in Aligner is now adjustable so that if one has ample RAM,
  160.   it is possible to draw even an entire lib
  161. * improved handling of RAM shortages
  162. * add n gaps to all but the currently selected sequence
  163. * calculate a DNA alignment that is identical to the corresponding protein 
  164.   alignment
  165. * added an error checking facility to check manually edited sequences against
  166.   the starting strings, disregarding added gaps, etc.
  167. * added a color editor facility so that the colors used for nucleotides or peptides
  168.   can be specified by a user
  169.  
  170.  
  171. New features added since version 1.0n6 (last version posted to indiana 
  172.     archives <ftp://ftp.bio.indiana.edu>, 8/94)
  173.  
  174. General:
  175. * a new stack "Codon Usage" was created to split off what was formerly part
  176.   of DNA Translator
  177. * revised help facilities throughout
  178. * added a more colorful "About DNA Stacks" dialog
  179. * enhanced the appearance of the startup process
  180. * new icons
  181. * resources and scripts common to Aligner and DNA Translator were moved to a
  182.   new "Startup" stack used by both of the other stacks
  183. * the new "Startup" stack also helps with more reliable expansion of the card 
  184.   size in Aligner
  185. * added support for newer versions of HyperCard or HyperCard Player, but did 
  186.   not use any HyperTalk commands specific to the newer versions so the stacks 
  187.   should, in theory, work on all versions back to version 2.0
  188.  
  189.  
  190. DNA Translator stack gene mapping cards:
  191. * reorganized menus on gene mapping cards, with some options now available
  192.   from a new "Extract" menu
  193. * import/export features were enhanced for gene maps
  194. * gene map selection lists now also include common names as well as scientific 
  195.   names, and these are listed in approximately phylogenetic, rather than 
  196.   alphabetic, order
  197. * more than 25 animal mtDNA maps are now available, and these have been split
  198.   into a "Metazoan mtDNA" card and a "Vertebrate mtDNA" card
  199.  
  200. DNA Translator stack utility cards:
  201. * these are still used but mostly without the user ever knowing it, because
  202.   most conversion/report options that were formerly only available from utility
  203.   cards are now more directly accessible from the "Data" menu of Aligner
  204. * added a "Multistate -> Binary" conversion
  205. * added a feature to find all repeated sequences of n length in a large
  206.   genomic sequence, with an option to decrement n until such repeats are
  207.   found
  208.  
  209. Aligner stack
  210. * completely reorganized menus so that all file opening, saving, and 
  211.   manipulations of data in the editor can be performed using the "Data" menu.
  212. * most of the data format conversions or reports that were formerly possible 
  213.   only from utility cards in DNA Translator are now available from the simpler 
  214.   menu structure of Aligner
  215. * added support for Phylip input files
  216. * it is now possible to use Aligner's menu to extract multiple animal mtDNA 
  217.   sequences for any specified gene regions directly to Aligner, whereas it was 
  218.   formerly necessary to extract them from the gene mapping facility of DNA 
  219.   Translator
  220. * Aligner now automatically detects the proper genetic code if the sequences
  221.   were extracted from the gene mapping facility
  222. * improved export of Nexus (PAUP/MacClade) format from within Aligner stack, 
  223.   including automatic provisions to interleave, match, and set data type
  224.   appropriately
  225.  
  226. The following is a somewhat out-of-date listing of conversions supported from
  227. either the "Data" menu of Aligner stack or (if you can't find it there) from
  228. the "Convert" menu or "field menus" of a utility card in DNA Translator.
  229.  
  230. A.   Import Formats Accepted
  231.    1.   Multiple sequence alignments
  232.       a.   Simple text files of string sequences, with or without
  233.            interleaves or match characters
  234.       b.   MBIR (EuGene, Prophet) "Doolittle" progressive alignments
  235.       c.   CLUSTAL nucleo- or peptide output.
  236.       d.   Nexus (PAUP, MacClade) files
  237.       e.   Phylip input files (from Aligner stack only)
  238.       f.   Phylip output files (i.e., matrix display option specified)
  239.            [Also normal Phylip input files, at least from the
  240.            "Data" menu of Aligner stack]
  241.       g.   Wisconsin GCG Pileup output files
  242.       h.   Treealign (by Jotun Hein) output files
  243.    2.   String sequences
  244.       a.   String sequence text files of the form: Name AGCTACCT...
  245.       b.   Data input from built-in sequence entry editor
  246.       c.   Sequences extracted from the provided gene mapper
  247.       d.   String output generated by many commonly used programs
  248.    3.   GenBank/EMBL or PIR-CODATA documented sequence files
  249.       a.   Converted to string sequences for use in conversions below
  250.       b.   GenBank or EMBL documented features to spreadsheet matrix
  251.       c.   Matrix directly convertable to rescalable gene map
  252.       d.   Gene map allows extraction of any mapped or custom subsequence
  253. B. Conversions provided
  254.    1.   Multiple sequence alignments (A1) converted/exported
  255.         in the following formats:
  256.       a.   Nexus (PAUP, MacClade) with optional cost matrices added
  257.       b.   Hennig86 (Nucleotide data only)
  258.       c.   Phylip 3.x formats (i.e., with or without interleaves)
  259.       d.   Multiple sequence strings (A2a) with gaps preserved or deleted
  260.    2.   String sequences (A2a,B1d) converted/exported in the
  261.         following formats:
  262.       a.   Unmodified to be reimported or converted as needed
  263.       b.   As straight single sequence strings for import by MBIR
  264.            (EuGene, Prophet), Authorin, Gene Construction Kit, etc.
  265.       c.   Intelligenetics format for import by many programs
  266.       d.   GenBank, EMBL, FASTP, or PIR-CODATA formats for viewing or
  267.            import by many programs
  268.       e.   Simple interleaved format with optional match characters
  269.            for manual alignment or reimport (A1a)
  270.       f.   Direct export of corresponding sequences (e.g., all animal
  271.            mtDNA cyt. B genes) from gene mapping facility to Aligner stack
  272.            [Animal mtDNAs can now be extracted directly from the
  273.            "Data" menu of Aligner.]
  274.       g.   A subblock of aligned strings to MULFOLD (RNA folding) format
  275.       h.   Consensus sequence created by combining two or more sequences
  276.            employing ambiguous nucleotide symbols (IUPAC-IUB)
  277.       i.   Subsequence, DNA <-> RNA,  upper <-> lower case, ACGTU -> 01233,
  278.            filter IUPAC-IUB codes, complementary strand sequence conversions
  279.       j.   Tally and display autapomorphies (site-unique nucleotides or gaps)
  280.            for sets of aligned nucleotide strings
  281.       k.   Compute compositional statistics of each nucleotide string
  282.       l.    Compute pairwise (uncorrected) identity comparison matrices
  283.       m.   Compute pairwise transversion/transition comparison matrices either
  284.            for all positions or by codon position
  285.    3.   DNA/RNA -> peptide translation
  286.       >   1st, 1st & 2nd, or all 3 possible reading frames output
  287.       >   Formatted output displays codons below amino acid abbreviations
  288.           with either 1- or 3-letter amino acid abbreviations
  289.       >   String output is useful for export or conversion (B2)
  290.       >   Can use standard or any of the provided codon usage tables
  291.       >   Custom codon usage tables can be added using a table editor
  292.       >   Codons with ambiguous nucleotide symbols (IUPAC-IUB) are
  293.           translated as appropriate when translation is unambiguous
  294.       >   Optional termination when stop codons are encountered
  295.    4.   Peptide -> DNA translation
  296.       >   Peptide strings can be backtranslated, using the reverse of
  297.           whichever codon usage table the user selects
  298.       >   Backtranslation uses IUPAC-IUB conventions for ambiguous
  299.           nucleotides 
  300. D.   Nucleotide or peptide sequence entry
  301.       [Aligner does most of this so that DNA Translator's editor is
  302.        not recommended.]
  303.       >   Special Editor field has autoformatting capabilities
  304.       >   Adjustable computer speaking supported during or after entry
  305.       >   Sequences can be edited, manipulated, or exported (B2) 
  306. E.   Data provided with stack
  307.       >   Codon usage patterns for about 70 organism/organelle combinations
  308.           [Codon Usage is now a separate stack.]
  309.       >   Most mitochondrial variation in coding supported (3)
  310.       >   Gene maps of 28+ mtDNAs plus string sequences for most
  311.       >   Gene maps and matrices for 3 green plant chloroplast DNAs 
  312. F.   General Features
  313.       >   Online help facility is available from any card in stack
  314.       >   References, taxon names, and sample data provided
  315.       >   Pulldown or popup menus or dialogs used for commands
  316.       >   Buttons or pulldown menus are used for stack navigation
  317.       >   Data fields can be locked or unlocked for text entry
  318.       >   Data fields shrink down or expand by clicking
  319.       >   Contents of fields exportable as text or printable
  320.       >   Codon usage tables output for any incorporated taxon
  321.           [Codon Usage is now a separate stack.]
  322.       >   Gene maps and codon usage graphs have special printing options
  323.       >   Default word processor for exported text files can be chosen
  324.       >   PAUP/MacClade specification for exported Nexus files
  325.       >   PAUP/MacClade open directly from the stack
  326.       >   Add gene mapping or utility cards as required
  327.       >   All data, scripts and resources used are easily accessible
  328.       >   Custom XFCNs by Nigel Perry enable efficient manipulations 
  329. G.   Hardware and System Requirements
  330.       >   Requires any Macintosh that can run HyperCard 2.0 or greater
  331.       >   HyperCard 2.x (2.0 or greater) or HyperCard Player (widely available for 
  332.           Macintosh users)
  333.       >   Macintosh System 6.0.5 or greater
  334.       >   2 or more MB Ram for HyperCard's partition recommended
  335. H.   Availability of current version
  336.       >   By WWW at <http://biology.fullerton.edu/people/faculty/doug-eernisse>
  337.       >   By anonymous ftp to at least the following site
  338.           Ftp.Bio.Indiana.Edu (after connection: 'cd molbio/mac'
  339.           and 'get DNAStacks_xxx.sea.hqx') where xxx is the
  340.           current version number (although this site is not guaranteed to have
  341.           the most current version)
  342.       >  Request it from me by email and I will attach the current version
  343.          (assuming your mail program can handle Eudora attachments for 
  344.          Macintosh).
  345.      
  346.    
  347. For further information, tips, trouble-shooting, and version history,
  348. see the online help facilities and tutorials.
  349.  
  350. These stack are only free for any noncommercial use and are not public
  351. domain. The DNA Stacks package is copyrighted 1990-1995 by D. J. Eernisse.
  352. The external resources (XFCN/XCMD) used are copyrighted and have copyright 
  353. restrictions similar to that of DNA Stacks (see DNA Translator and
  354. Aligner stack scripts for details).